点击上方 “中国科学信息科学”, 及时获取期刊动态!
零样本图像分类综述: 十年进展
冀中, 汪浩然, 于云龙, 庞彦伟
中国科学: 信息科学, 2019, 49(10): 1299-1320
关键词 零样本图像分类, 属性, 词向量, 跨模态映射, 领域适应学习
零样本分类 (zero-shot classification, ZSC), 也称作零样本学习 (zero-shot learning), 是指依据一些可见类别 (seen classes) 的数据, 辅以相关常识信息或先验知识, 用于训练某种学习模型, 实现对未见类别 (unseen classes, 指数据标注完全缺失的类别) 的数据进行类别预测和识别的一类技术. 在这种分类场景下, 训练集合和测试集合的类别是不相交的, 这显著有别于传统的分类任务.
图1. 零样本分类与传统的目标分类的区别
现有的物体分类技术大多属于监督学习, 即需要大量标注数据训练相关模型, 这是一件极其费力的工作. 此外, 现实世界中物体的种类还在不断增长, 这需要识别系统不断增加新的数据并重新进行训练, 这些问题严重阻碍了相关技术的进一步发展. 人们迫切需要一种在目标类别的视觉标注数据完全缺失的情况下仍然能够识别这些类别数据的技术. 受到现实需求以及技术不断发展的双重驱动, 零样本分类技术应运而生了.
零样本图像分类指训练集和测试集在数据的类别上没有交集的情况下进行图像分类. 该技术是解决类别标签缺失问题的一种有效手段, 因此受到了日益广泛的关注. 自提出此问题至今, 零样本图像分类的研究已经大致有十年时间.
图2. 目标分类技术的发展过程和趋势
该评述以时间为线索, 分析了零样本技术的前世今生、发展脉络, 以及技术要点, 讨论分析了与相关技术的区别联系, 并且对零样本分类技术面临的问题与挑战以及几个重要的发展趋势进行了探讨, 旨在让广大读者了解零样本技术的发展历史、常见技术, 以及发展趋势.
介绍了零样本图像分类技术的研究意义及其应用价值;
重点总结和归纳了零样本图像分类的发展过程和研究现状;
介绍了常用的数据集和评价准则, 以及与零样本学习相关的技术的区别和联系;
分析了有待深入研究的热点与难点问题, 并对未来的发展趋势进行了展望.
欲了解更多信息,可识别上方二维码,免费下载全文PDF.信息安全科普短视频——数据加密
仿生黑科技!以假乱真的水母
人机混合智能研究进展
人机交互与人工智能: 从交替浮沉到协同共进
查阅我刊已出版文章,长按并识别以下二维码,获取《中国科学:信息科学》快速访问入口!